关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题吗?更新问题,以便editingthispost提供事实和引用来回答它.关闭去年。Improvethisquestion我们计划从头开始编写一个Web应用程序,已决定使用符合JavaEE6标准的最新版Glassfish,因此我们正在分析是否可以使用CDI来代替Spring。我们可以说CDI可以替代Spring吗? 最佳答案 2021年更新:我回答最初的问题已经10年了,但我仍然偶尔获得支持。我能否请future的读者接受我的回答:2011年Java企业版图
按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visitthehelpcenter指导。关闭10年前。最近有一个article在GigaOm中,关于Hadoop的日子已经不多了,还有许多不同的选择,比如Percolator,Dremel和Pregel.ApacheHama,ApacheGiraph,GoldenOrb和GraphLab是Pregel的一些实现。我想知道是否有Percolator和Dremel的开源/闭源实现。
通过在hive中使用ORDERBY,它只使用单个reducer。所以ORDERBY是低效的。ORDERBY是否有可用的替代解决方案。问候,拉托 最佳答案 您可能希望结合使用DISTRIBUTEBY和SORTBY。DISTRIBUTEBY将确保具有特定值的所有键都将在同一个数据节点上结束。然后SORTBY将对每个节点上的数据进行排序。例如:SELECTa,b,cFROMtableDISTRIBUTEbyaSORTBYa,bORDERBY会将所有数据排序在一起,这就是它必须通过一个reducer的原因。
从阅读有关Akka的文章和我自己开始使用它开始,在我看来,Akka可以用于某些应用程序,而且比Hadoop设置更简单。你不会使用HDFS,但你可以编写一个应用程序,将工作发送到不同的“映射器”并将结果发送到“reducer”,并且它比VM中的Hadoop更容易设置或在硬件上,要设置的服务更少。这是合理的还是这两种技术用于完全不同的事情? 最佳答案 是的,完全合理。我们已经使用Akka2.0构建了一个大规模(1000多个工作人员)的map-reduce系统。Akka2.2+更好,因为你可以使用clustering和remotedeat
谁能推荐好的解决方案(框架)来访问HBase在Hadoop来自Scala的集群(或Java)申请?现在我要搬进了scalding方向。我获得的原型(prototype)允许我将scalding库与Maven结合起来并将scalding作业JAR与“库”代码包分开。这反过来又允许我从外部集群运行基于Scalding的Hadoop作业,每个作业的开销最小(“库”代码仅在更改时(很少需要)发布到集群“分布式缓存”,因此我可以快速加载作业代码).现在我实际上开始使用HBase本身,我发现scalding很好,但它不是HBase的“原生”。是的,有类似hbase-scalding的东西但无论如何
我有一个奇怪的问题。有哪些分布式和可扩展的hadoop替代品。我正在寻找一些分布式文件系统,如HDFS,它可以用作廉价且有效的存储,并希望在其之上有一个数据处理引擎(批处理/实时)。我知道Spark是一个不错的选择。但我想将这个系统用作分布式、容错和可扩展的文件存档。有什么合适的解决方案吗?欢迎提出建议。谢谢:) 最佳答案 这些是Hadoop和ApacheSpark的一些其他替代方案。ClusterMapReduce、Hydra和Conclusion,都是比较适合做大数据项目的。在这里阅读更多https://datafloq.com
值得注意的是,MultipleTextOutputFormat尚未迁移到新的API。因此,如果我们需要选择一个输出目录并根据动态写入的键值输出fiename,那么我们使用新的mapreduceAPI有什么替代方案? 最佳答案 我使用的是AWSEMRHadoop1.0.3,可以根据k/v对指定不同的目录和文件。使用MultipleOutputs类中的以下任一函数:publicvoidwrite(KEYOUTkey,VALUEOUTvalue,StringbaseOutputPath)或publicvoidwrite(Stringnam
Druid用于实时和批处理。但是它能完全替代hadoop吗?如果不是为什么?至于hadoop比德鲁伊有什么优势?我读过德鲁伊与hadoop一起使用。那么是否可以避免使用Hadoop呢? 最佳答案 我们在这里谈论的是两种略有关联但截然不同的技术。Druid是一个实时分析系统,非常适合时间序列和基于时间的事件聚合。Hadoop是HDFS(分布式文件系统)+MapReduce(执行分布式进程的范例),它们共同创建了分布式处理的生态系统,并作为许多其他开源项目的基础/影响技术。你可以设置druid来使用Hadoop;也就是触发MR作业索引批
关闭。这个问题不符合StackOverflowguidelines.它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。关闭23天前。Improvethisquestion是否有MapReduce(Google、Hadoop)的替代范例?大问题的拆分合并还有其他合理的方法吗?
所以我尝试使用PHP发送一个相当简单的HTML电子邮件。在过去的三天里,我一直在寻找一个好的解决方案,并认为我找到了一个,但是当我测试它时,它没有正确发送。我从我引用的其中一个教程中借用了这段代码。测试代码如下:--Content-Type:text/plain;charset="iso-8859-1"Content-Transfer-Encoding:7bitHelloWorld!!!Thisissimpletextemailmessage.--Content-Type:text/html;charset="iso-8859-1"Content-Transfer-Encoding:7